系统综述与meta分析（3/5）：筛选文献及提取数据

Original 唐金陵杨祖耀临床研究与循证医学 2022-03-25

本文是“系统综述与meta分析”全部5集系列的第3集，之前各集的链接见下：

系统综述与meta分析（1/5）：提出研究问题

系统综述与meta分析（2/5）：检索文献

第一节引言

第二节研究问题和文献收集

一、提出研究问题

二、检索文献

三、筛选文献

四、文献检索的记录和管理

第三节提取数据

一、数据提取的原则

二、数据提取的内容

第四节评价原始研究质量

第五节分析数据

第六节报告的撰写和更新

第七节系统综述的特点和优缺点

第八节系统综述的偏倚和质量评价

第九节系统综述和meta分析进展

三、筛选文献

筛选文献就是在收集到的可能合格的文献中挑选出真正合格的研究。由于不同文献库重叠收录的文献很多，筛选文献的第一步是利用文献管理软件（如EndNote），将MEDLINE、EMBASE和考科蓝图书馆等文献库检索到的文献进行合并，并通过文献管理软件的“查找重复”功能，剔除重复的文献。有时重复的文献可达三分之一甚至更多，剔除这些文献，可大大减轻进一步手工筛选文献的工作量。

然后，研究者必须对收集到的文献一一进行阅读和审核，判断它们的合格性，并收集和保存合格研究的全文。为了保证系统综述制作过程的客观性和可重复性，并减少筛选文献中的主观偏倚，在手工筛选文献时，须遵守以下两个原则：

（1）严格按照预先制定的入选和排除标准决定一个研究是否合格；

（2）双人平行独立筛选。就是两个不同的研究者分别对收集到的文献进行独立的审核和筛选，当合格性判断不一致时，由双方讨论协商决定，协商失败时，可咨询第三名更有经验的研究者并以其意见为准。

手工筛选文献首先是浏览文献题目和摘要，据此可以把文献初步分为可能合格、明确不合格和合格性不明三类。根据题目和文摘，几乎可以肯定有些文章是无关的，这些文章可以直接剔除，无需进一步审核。但是，仅仅根据题目和文摘能够断定合格的文章很少，因此，根据题目无法判断合格性的或判断可能合格的所有文章，都应获取全文，最后根据全文再进行判断。

至此，入选的文章还可能存在两个问题。第一个问题是同一研究的重复报告，即同一个研究可能多次发表：有些是基线数据的报告，有些是研究设计的报告，有些是次要结局的报告，有些是早期结果的报告，有些是同一结果的重复报告，都应该剔除。另一个问题是不符合入选标准。一个研究是否真正符合纳入标准，大多情况下须通过阅读全文，才能确定其PICOS和研究设计是否符合预先制定的入选标准。

综上所述，图4总结了筛选文献的流程和步骤。

图4. 系统综述中筛选文献的流程和步骤

四、文献检索的记录和管理

研究者应尽可能详细地明确地记录和保存文献检索和筛选的过程（或简称检索史），具体内容应包括：文献来源（如文献库）、检索策略、检索步骤，以及每一步的结果。其目的是保证研究的透明性和可重复性，有关资料也是判断研究真实性的依据之一，同时也方便研究者自己回头核查和修正。记录的详尽程度至少应该保证“文献筛选流程图”（the flow chart of study selection）的制作需要。“文献筛选流程图”是每一项系统综述必须报告的内容，其形式和内容详见图5列举的实例。

图5. 文献筛选流程图实例

资料来源：Yang ZY，Shen WX，Hu XF，et al. J Hematol Oncol，2012，5：52.

注：①第一步，文献检索的结果，包括检索电子数据库和通过其它途径得到的相关文献的数量；②第二步，初步筛选的结果，包括剔除的重复文献的数量、经过初步筛选排除的文献的数量以及排除原因；③第三步，详细评估的结果，包括阅读过的全文的数量、被排除的全文的数量以及排除原因；④ 第四步，文献筛选的最终结果，最好注明被纳入系统综述和用于meta分析的文献分别有多少。

具体来讲，对于电子文献库的检索，应记录文献库的名称（如MEDLINE）、所用的检索平台（如OVID、PubMed）、检索的操作时间（年、月、日）、每一步所用的检索词、检索限制（如对发表年份、人类研究、语种等限制），以及每一步得到的文献数等内容。对于查阅的会议文摘，则应记录会议的名称、时间、地点，例如：第一届 AMA虐待和忽视儿童全国研讨会；1984 年3月30-31日；芝加哥。对于手工检索的期刊，应记录检索的期刊名称、起止年限、月份和具体的卷期数，例如：英国外科杂志 1948年 1月至1988年12月之间所有卷期发表的文章。

其它检索的情况也应简要总结。例如，有无进行其他资源的检索（如网页），并说明检索日期、检索词及相关网站的情况；是否联络过相关领域的专家和研究者，其结果如何；查阅过哪些文献的参考文献、分别发现了多少合格的研究。关于手工筛选文献，应记录文献筛选者的姓名，两人均认为可纳入和可排除的文献有多少，有争议的文献有多少，争议是如何解决的（两人讨论，是否征求了第三者意见），结果如何，等。在发表系统综述的时候，通常会把检索史作为电子版附件，供读者参考。

第三节提取数据

一、数据提取的原则

与其他流行病学研究（如队列研究）相似，确定了研究问题就明确了研究对象，系统综述的研究对象不是一个一个的人，而是一个一个的研究；文献检索正如征募研究对象的过程；从每一个研究中提取必要的数据正如测量每一个研究对象的有关变量。提取数据就是从每一个合格的研究中提取研究必要的信息。

一项研究搜集的数据包括质和量两个方面。这里，“量”特指收集的变量的多少，“质”特指收集的变量信息的准确性。变量数越多，可回答的研究问题就越多；数据质量越高，信息偏倚就越低，结果的真实性就越高。在资源有限的情况下，一项研究收集的数据的质和量可能成反比，即收集的数据越多，数据的质量可能越低。因此，与其他流行病学研究一样，系统综述的数据收集必须严格围绕研究目的展开，只提取与研究目的有关的数据，不提取与研究目的无关的数据。这样才能把有限资源用在提取有用的数据之上，保证数据的质量。由于系统综述数据提取相对比较简单省时，一个常犯的错误是提取了很多没有用的数据。出于同一个原因，我们的建议正好相反：先收集最基本的信息，必要时可以随时补充收集新的必要的信息，这样就可以大大减少收集不必要的信息。

与一般流行病学现场测量不同的是，在系统综述数据提取中，无需仪器，也无需问卷，主要是通过研究者阅读研究报告，发现和记录有关信息。因此，系统综述的数据提取不存在仪器误差，也没有回顾偏倚，其准确性主要取决于原始研究报告的准确和清晰程度，以及研究者阅读文献的认真和仔细程度。保证系统综述数据准确性的关键在于数据提取过程的客观、透明和可重复的程度。为此，数据提取应遵循以下几个原则：

（1）准确定义要提取的各个变量；

（2）制作数据提取表（data extraction form），并提供必要的、详细的数据提取和表格填写说明；

（3）进行预试验，并根据预试验的结果修改和完善数据提取表和说明；

（4）双人平行独立提取数据，即让两个不同的研究者分别独立地提取数据，当两人提取的数据不一致时，由双方讨论协商解决，协商失败时可咨询第三名更有经验的研究者并以其意见为准；

（5）妥善保存有关记录，包括数据不一致的地方及其最后解决方法。

二、数据提取的内容

数据提取的具体内容因研究目的的不同会有所不同，但一般来说不外乎以下几个方面：

（1）确定研究身份的信息

（2）决定结果适用范围和亚组分析的PICOS数据

（3）确定研究真实性的方法学方面的信息

（4）Meta分析需要的信息：效应估计及其标准误

（5）用于敏感性分析的数据（通常已经包含在前四类数据中）

（6）用于其他分析的数据（通常已经包含在前四类数据中）

确定研究身份的资料一般包括第一作者、发表的杂志和发表年份，就像研究对象的电话和地址一样，主要是用来显示数据来源和核实数据。

决定系统综述结果未来适用性或外推性的因素一般包括病人的特征（如年龄、性别、种族、疾病严重程度等）、治疗的安排（如给药途径、剂量、治疗时间等）、治疗环境和服务质量等。这些资料是对纳入的研究特征的基本描述，更重要的是作为未来决策者使用时的参考。例如，如果大部分研究都是在中年女性中进行的，使用于儿童、老人和男性时就应慎重。这些特征也是探索异质性来源、确定效应修饰作用时所必需的资料。

决定或影响研究真实性的方法学因素有很多，最重要的是研究设计类型，比如随机对照试验优于前瞻性研究；其次是一类研究其他偏倚控制措施，例如临床试验的真实性的决定因素包括随机分组、分组隐藏、盲法、随访率、依从性、维持原随机分组分析（intention-to-treat analysis）、结局指标测量的准确性等，详见本章第四节。

在临床试验里，关于原始研究结果的信息主要是效应大小的估计及其抽样误差，是估计总体效应不可或缺的信息。当抽样误差没有直接报告时，可利用可信区间、p值、标准差、图形、甚至原始四格表数据等信息进行估计。提取数据时，必须统一效应指标。例如，测量二分变量的效应指标包括相对危险度、比值比、相对危险降低百分数、率差、需治人数等。如果有些研究用的是相对危险度，而另一些用比值比，则必须统一为一种。从统计学角度选择，一般建议使用比值比，因为不同研究比值比的一致性比较好，更适于meta分析合并。绝大多数系统综述都会直接提取治疗和结局的四格表中的四个原始数据，这样会大大提高数据分析的灵活性。

一般来讲，关于研究身份的信息、PICOS信息以及研究方法学信息，只需提取一套数据。然而，对结果的信息，可能需要依据比较的组合和结局指标的不同，分别提取多套数据。例如，一个拥有三个比较组的临床试验，即治疗A、治疗B和安慰剂组，可能的比较就有三种，即A与安慰剂比较，B与安慰剂比较，以及A与B比较。如果三种比较都是综述关注的内容，则需分别提取3种比较组合的三套“两组之差及其抽样误差”。如果该研究有两个有关的临床结局，则共需提取6套“两组之差及其抽样误差”的数据。每一套数据就是一个meta分析的数据单元，多个原始研究提供的同一套数据只能纳入一个meta分析中，因此6套数据就意味着6个meta分析（图6）。

图6. 需从原始研究中提取的数据内容（以结局为二分类变量的随机对照试验为例）

有时，一个随机对照试验有一个安慰剂（或无治疗的）对照组，以及两个或多个干预组，而且这两个干预组都适合纳入同一个meta分析，这时对照组的数据将会被重复利用而夸大了该研究的权重。对于这种情况，有几种处理方法。第一种方法是修订某meta分析的纳入标准，使得其中一个治疗组不再适合纳入同一meta分析。第二种是将两个治疗当成一个看待，将两组合并后的数据纳入同一meta分析。第三种方法是最常用的方法，就是把对照组的人数一分为二，分别与两个干预组比较，然后把这两个比较当作两个独立的研究纳入同一个meta分析。具体的操作方法参见考科蓝综述手册。

有时，在纳入研究、提取有关信息等问题上，可能存在疑问，或有多种不同的提取方法，但又不能确定哪种最好。这时，可以使用不同的方法，分别提有关取数据，然后进行敏感性分析，即按照不同方法提取的数据，分别进行meta分析，并依据两种分析结果的区别做出合适的结论。比如，某研究没有直接报告抽样误差，而且两种不同方式估计的抽样误差不同，这时就应该依据两个不同的方法估计两个抽样误差，并分别进行meta分析，如果总体结果没有差异，那么哪种方法都没有关系，如果总体结果存在差异，则当仔细分析哪个结果可能更可靠，并慎重做出结论。

有些研究可能希望进行一些特殊的分析，如依据发表年份进行累积meta分析，这时发表年份就是一个必须提取的数据。另外，当研究报告有重要信息缺失时，可直接与作者取得联系。通讯作者提供的电邮地址使得联系作者变得十分容易。但是，为了提高应答率，信函一定要简短明了，索求的信息一定要明确，不要询问不需要的信息，更不要询问发表的文章中可以获得的信息。

原文出处：第十四章: 系统综述与Meta分析. 见: 李立明主编. 《流行病学》. 第一卷. 第三版. 北京: 人民卫生出版社, 2015. （略有改动）

（本文是全文五个部分的第三部分，未完待续）

编辑：冯琦、朱影影、黄蔚然、傅晓红

系统综述与meta分析（1/5）：提出研究问题

系统综述与meta分析（2/5）：检索文献

Meta分析屡掀起医学圈讨论，它到底是何方神圣？

唐金陵：流行病学在医学研究和发展中的地位和作用

唐金陵：病因、病因模型与因果关系推断（五）

BMJ | 循证医学：一场远没有结束的医学变革

关于循证医学、精准医学和大数据研究的几点看法

长按上方二维码关注我们